由于字体之类的文本属性是文档格式和页面样式的核心设计元素,因此自动属性识别有利于全面的实用应用。现有方法在区分不同属性方面已经产生令人满意的性能,但是它们仍然在区分类似属性的情况下只有微妙的差异。此外,在现实世界中出现意外和明显的成像扭曲的现实情况下,他们的性能严重下降。在本文中,我们旨在通过提出炸玉米饼来解决这些问题,炸玉米饼是针对最常见文档场景量身定制的文本属性识别的对比框架。具体而言,炸玉米饼利用对比学习来消除由模糊和开放式属性引起的歧义陷阱。为了实现这一目标,我们从三个角度设计了学习范式:1)生成属性视图,2)提取微妙但至关重要的细节,以及3)利用有价值的视图对学习,以充分解锁预训练潜力。广泛的实验表明,Taco超过了受监督的对应物,并在多个属性识别任务上取得了最新的进步。将提供炸玉米饼的在线服务。
translated by 谷歌翻译